AI资讯新闻榜单内容搜索-AI

给语音模型戴上「眼镜」，错误率降低12.5%！人大CMU最新开源 | AAAI 2025

视觉+语音=更强的语音识别！BPO-AVASR通过优化音视频输入和输出偏好，提升语音识别在真实场景中的准确性，解决了传统方法在噪声、口语化和视觉信息利用不足的问题。

来自主题: AI技术研报

8547 点击 2025-03-24 16:01

CVPR 2025 | Qwen让AI「看见」三维世界，SeeGround实现零样本开放词汇3D视觉定位

3D 视觉定位（3D Visual Grounding, 3DVG）是智能体理解和交互三维世界的重要任务，旨在让 AI 根据自然语言描述在 3D 场景中找到指定物体。

来自主题: AI技术研报

8288 点击 2025-03-24 15:47

我花 399 买了把 AI 键盘，难用但不是智商税，还有一点值得抄作业

前段时间 AI 成了带货密码，而其中卖得最好的品类之一就是 AI 键盘。

来自主题: AI资讯

11165 点击 2025-03-24 11:00

速递｜Meta被曝与云巨头密签Llama分成协议，开源模型的寄生式盈利

在 2024 年七月的一篇博客文章中，Meta CEO 马克·扎克伯格表示，“出售访问权限”给 Meta 公开可用的 Llama AI 模型“不是 Meta 的商业模式。”

来自主题: AI资讯

11418 点击 2025-03-24 10:52

ICLR 2025 Spotlight｜让机器人实现「自主进化」，蚂蚁数科、清华提出具身协同框架 BodyGen

最近，全球 AI 和机器学习顶会 ICLR 2025 公布了论文录取结果：由蚂蚁数科与清华大学联合团队提出的全新具身协同框架 BodyGen 成功入选 Spotlight（聚光灯/特别关注）论文。

来自主题: AI技术研报

9142 点击 2025-03-24 10:03

CVPR 2025满分论文：开源三维生成框架Craftsman3D&Dora革新三维资产生成与编辑

香港科技大学谭平教授团队在 CVPR 2025 发表两项三维生成技术框架，核心代码全部开源，助力三维生成技术的开放与进步。其中 Craftman3D 获得三个评委一致满分，并被全球多家知名企业如全球最大的多人在线游戏创作平台 Roblox, 腾讯混元 Hunyuan3D-2，XR 实验室的 XR-3DGen 和海外初创公司 CSM 的 3D 创作平台等重量级项目的引用与认可。

来自主题: AI技术研报

7901 点击 2025-03-24 09:59